AssignAdd

将输入张量的值累加到输出张量中,实现张量原地加法操作。

\[output_i = output_i + input_i\]
输入:
  • input - 输入数据地址。

  • output - 输出数据地址(同时作为输入和输出)。

  • length - 数组长度(元素个数)。

  • core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。

输出:
  • output - 原地写回累加结果。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持的数据类型:int8, int16, int32, fp32, fp64, cplx64, cplx128

  • MT7004 支持的数据类型:fp16, fp32, int16, int32, cplx64

共享存储版本:

void i8_assignadd_s(int8_t *input, int8_t *output, int length, int core_mask)
void i16_assignadd_s(int16_t *input, int16_t *output, int length, int core_mask)
void i32_assignadd_s(int32_t *input, int32_t *output, int length, int core_mask)
void fp_assignadd_s(float *input, float *output, int length, int core_mask)
void dp_assignadd_s(double *input, double *output, int length, int core_mask)
void c64_assignadd_s(float *input, float *output, int length, int core_mask)
void c128_assignadd_s(double *input, double *output, int length, int core_mask)
void hp_assignadd_s(half *input, half *output, int length, int core_mask)

C调用示例:

 1// FT78NE 多核示例
 2#include <stdio.h>
 3#include <assignadd.h>
 4
 5int main(int argc, char* argv[]) {
 6    float *input = (float *)0xA0000000;   // input在DDR空间
 7    float *output = (float *)0xB0000000;  // output在DDR空间,同时作为输入和输出
 8    int length = 1000;
 9    int core_mask = 0xff;
10
11    // 执行 output[i] += input[i]
12    fp_assignadd_s(input, output, length, core_mask);
13    return 0;
14}

私有存储版本:

void i8_assignadd_p(int8_t *input, int8_t *output, int length)
void i16_assignadd_p(int16_t *input, int16_t *output, int length)
void i32_assignadd_p(int32_t *input, int32_t *output, int length)
void fp_assignadd_p(float *input, float *output, int length)
void dp_assignadd_p(double *input, double *output, int length)
void c64_assignadd_p(float *input, float *output, int length)
void c128_assignadd_p(double *input, double *output, int length)
void hp_assignadd_p(half *input, half *output, int length)

C调用示例:

 1// MT7004 单核示例
 2#include <stdio.h>
 3#include <assignadd.h>
 4
 5int main(int argc, char* argv[]) {
 6    half *input = (half *)0x10000000;   // input在L2空间
 7    half *output = (half *)0x10004000;  // output在L2空间,同时作为输入和输出
 8    int length = 1000;
 9
10    // 执行 output[i] += input[i]
11    hp_assignadd_p(input, output, length);
12    return 0;
13}